...。 虽然这是一个问题,但我并不认为是最本质的。最本质的问题是:游戏实际上构建了一个模拟环境,通常其中的奖励函数(reward function)是为了让人们找到游戏乐趣,这意味着,时不时出现的小奖励可以帮你找到正确的方向。
基于20个网页-相关网页
heuristic reward function 启发式回报函数
reward-for-stopping function 报酬止损函数
reward for stopping function 报酬止损函数
Reward function must to strengthen but not to kill the effect of other management action.
薪酬活动是要加强而不是要抵消其它管理活动的作用。
Not surprisingly, passionate love fires the reward part of the brain, but it also affects the higher-order cognitive function seen in body image.
并不令人吃惊的是,激情之爱可激发大脑获得报酬而产生愉悦感的区域,它同时也影响到身体意象的高阶认知功能。
The fitness function is similar to the one from the original example, but the reward structure is different and the loop is actually simplified.
fitness函数与最初示例中的相似,但“奖赏”的结构有所不同,而且循环实际上也进行了简化。
应用推荐